JANUS: Evaluando la distorsión informativa en modelos de lenguaje
Descubre JANUS, un benchmark que mide cómo los LLMs distorsionan hechos al omitir evidencia adversa o enfatizar detalles favorables. Resultados reveladores.
Descubre JANUS, un benchmark que mide cómo los LLMs distorsionan hechos al omitir evidencia adversa o enfatizar detalles favorables. Resultados reveladores.